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摘 要 : [目的 /意义 ] 解 决 颠覆 性 指数 在 数学 性 质 上 存在 的 不 一 致 性 问题 ,并 探讨 颠覆 性 指数 在 应 用 中 的 影响 因素 。[ 方 


法 /过程 ] 首 先 指 出 颠覆 性 指数 D 的 不 一 致 性 表现 ,然后 对 其 改进 得 到 相对 性 颠 惟 性 指数 Rela_D, 和 绝对 性 颠 履 


性 指数 D;; 最 后 从 引文 时 间 窗 、* 


学 科 差 异 和 文献 类 型 3 个 角度 


,分 析 影 响 颠 履 性 指数 差异 的 因素 。 [ 结果 /结论 ] 


Rela_D， 算法 解决 了 DD 关于 Ns 非 单调 的 问题 ,Dy 算法 解决 了 D 关于 Ni、Ns 不 严格 单调 的 问题 ,从 而 避免 了 不 一 


致 性 ;将 颠覆 性 指数 
引文 时 间 窗 、 
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的 相对 性 与 绝对 性 两 个 算法 结合 ,在 应 用 中 将 更 加 合理 。 此 外 ,颠覆 性 指数 Rela_D, 和 D， 受 
学 科 和 文献 类 型 的 影响 ,因此 ,在 应 用 时 应 进行 必要 的 处 理 。 
创新 性 ”不一致 性 ”科研 评价 ”引文 分 析 
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演化 历程 » 科研 华文 的 创新 性 和 新 颖 性 逐渐 得 到 重 


第 三 = 关 研 究 内 知识 组 合 的 角度 定义 创新 性 或 新 性 
比 由 3 Uzzi 等 2 YLee 等 JWang 等 上 和 Y. He 
等 “从 参考 文献 所 属 期 刊 的 非典 型 组 合 的 角度 度量 六 
颖 性 ;K，Boyack 等 '" 、.R，Klavans 等 中 等 从 学 科 组 合 
的 角度 定义 创新 ,构建 学 科 地 图 ,并 通过 相关 学 科 的 学 
科 距 离 进行 度量 ;N.Carayol 等 ” 、 王 艳 艳 等 ” .未 万 辉 
等 ”沈阳 "和 杨 建 林 等 ”依据 关键 词 . 文 本 内 容 ， 
从 共 词 和 文本 语义 的 角度 测量 论文 的 新 颖 性 。 第 二 类 
研究 从 时 间 的 角度 定义 新 颖 性 。 比 如 S. Mishra 
等 (中 M，Packalen 等 "和 下， Callaway[05 等 通过 概念 
F 龄 衡量 文章 的 新 颗 性 , 即 文中 涉及 的 概念 被 提出 的 


内 


时 间 越 晚 ,研究 内 容 就 相应 el 第 三 0 
引文 结构 测度 创新 ,如 D，Trapido" 、R，Funk 等 


an 
构 衡量 论文 对 以 往 知 识 的 替代 作用 和 对 以 后 论文 的 影 
响 程 度 ,并 以 此 定义 颠覆 性 。 

颠覆 性 指数 作为 衡量 创新 性 的 一 个 重要 指标 , 自 
是 出 以 来 受到 了 科学 计量 界 学 者 们 的 广泛 关注 ,同时 
也 指出 了 其 存在 的 不 一 致 性 问题 。 本 文 针对 颠覆 性 指 
数 的 不 一 致 性 提出 改进 算法 ,并 对 改进 后 的 颠覆 性 指 
数 的 应 用 效果 和 影响 因素 进行 系统 的 分 析 。 


颠覆 性 指数 的 相关 研究 


目前 国内 外 关注 度 较 高 的 创新 测度 指标 是 颠覆 性 
指数 D( Disruption Index) ” ,已 有 学 者 对 该 指标 展开 
了 详细 的 探索 。 一 部 分 研究 是 对 颠覆 性 指数 的 应 用 
如 工 .Bornmann 等 "应 用 DD 算法 计算 了 Scientometrics 
期 刊 从 2000 至 2010 年 间 发 表 论 文 的 颠覆 性 指数 ,发 
现 该 期 刊 论文 的 颠覆 性 指数 集中 在 0 左右 ,只 有 极 少 
数论 文 有 较 大 的 差异 。L. Bormmann 等 还 对 颠覆 性 指 
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数 D 的 计算 需求 进行 探索 ,分 析 4 篇 来 自 不 同学 科 的 
论文 ,发 现 颠 覆 性 指数 取决 于 引文 时 间 窗 串 , 至 少 需 
要 3 年 才能 趋 于 稳定 。 此 外 ,还 有 一 部 分 研究 针对 其 
覆 性 指数 D 的 算法 进行 探索 。 如 工 _ Bornmann 等 针对 
颠覆 性 指数 算法 D 能 否 真正 度量 颠覆 性 的 问题 进行 履 
进 ,提出 了 一 族 新 的 颠覆 性 指数 算法 D1" ,并 应 用 
DI; 重新 计算 了 Scientometrics 期 刊 论文 的 颠覆 性 指数 ， 
与 先前 D 算法 的 结果 进行 对 比 ,发 现 DI; 更 能 识别 
引起 学 科 领 域内 研究 人 员 注 意 的 颠覆 性 研究 成 果 。 
Q. Wu 等 应 用 原 颠 覆 性 指数 算法 中 的 元 素 ,提出 了 4 
个 类 似 指标 ,发 现 了 3 种 相对 合理 的 算法 可 以 用 于 计 
算 颠 窗 性 指数 。 

但 是 , 现 有 研究 基本 不 涉及 颠覆 性 指数 的 性 质 或 
礁 雇 用 过 程 中 的 影响 因素 ,即使 有 学 者 探究 颠覆 性 指 
数 网 稳定 时 间 窗 ,也 仅 用 了 4 篇 论文 作为 分 析 样本 ,这 
在 纺 计 学 中 不 具 一 般 性 ,结论 缺乏 代表 性 。 
2 颠覆 性 指数 概念 介绍 
己 颠 覆 性 指数 D 最 初 由 R，Funk 等 "提出 并 应 用 
于 专利 ,2019 年 L， Wu 等 中 将 该 指数 拓展 于 论文 . 计 
te 
性 大 团队 更 具 发 展 性 的 科学 活动 规律 ,该 发 现 被 作为 
NEe 的 期 刊 封 面 文章 刊 出 。 颠 覆 性 指数 的 计算 方法 
娘 并 (1) 所 示 ， 
> 


| Ni -An . 
>< D=p; Pa TN rN, +N. 式 (1) 
Ct 1) 中 ,所 有 统计 量 的 统计 时 间 节 点 均 是 指 焦 


点 论文 ( 即 被 评价 的 论文 ) 发 表 之 后 。L. Wu 等 把 焦 
点 喉 文 发 表 之 后 的 研究 分 为 3 类 ( 见 图 1): 第 一 类 只 


用 焦点 论文 的 参考 文献 , 记 为 B 类 ;第 三 类 只 引用 焦点 
论文 的 参考 文献 ,而 不 引用 焦点 论文 , 记 为 R 类。 基于 
此 ,颠覆 性 指数 被 定义 为 F 类 研究 和 B 类 研究 的 占 比 
之 差 。 式 (1) 中 ,Ns、Ns、Ns 分 别 指 了 类、.B 类 和 RR 类 
施 引 论文 的 数量 。 
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图 1 颠覆 性 指数 概念 示意 


D 的 取 值 范围 是 [ -1,1]。D >0, 表 示 焦 点 论文 


高 颠覆 性 ;D <0, 表 示 焦 点 论文 偏 发 展 性 。 当 N, = Ni 
=0 时 ,D =1, 表 示 焦 点 论文 完全 颠覆 原 有 研究 ; 当 N; 
= Ni =0 时 ,D = -1, 表 示 焦 点 论文 完全 发 展 . 巩 固 了 
原 有 研究 。 当 N; = N, 时 ,D =0 ,表示 焦 点 论文 中 立 。 

虽然 颠覆 性 指数 得 到 了 广泛 的 响应 与 认可 ,但 是 
经 研究 发 现 , 该 指数 在 数学 性 质 上 存在 不 一 致 性 ,导致 
在 实际 应 用 中 可 能 会 出 现 不 准确 的 结论 。 
2.2 颠覆 性 指数 的 不 一 致 性 

“不 一 致 性 是 社会 心理 学 中 * 认 知 相 符 理论 ”5 
的 一 个 对 立 概 念 。 在 科学 计量 学 中 ,不 一 致 性 可 以 理 
解 为 :在 一 个 指标 中 , 随 着 自 变量 的 改变 , 因 变 量 发 生 
的 变化 与 人 的 直观 期 望 相悖 。 目 前 计量 学 界 的 国内 外 
学 者 对 于 不 一 致 性 指标 已 经 有 了 部 分 研究 ,如 AI 指 
数 ” \H 指数” .期刊 影响 因子 ”的 不 一 致 性 等 。 根 
据 工 .Egghe 等 的 研究 ,不一致 性 包括 不 满足 单调 性 和 
相对 独立 性 ”两 种 。 

颠覆 性 指数 的 不 一 致 性 是 指 关 于 N' 不 满足 单调 
性 。S. Wu 等 最 早 在 虚拟 个 例 层 面 指出 了 该 指标 存在 
不 一 致 性 的 表现 ” ,但 是 ,并 未 系统 揭示 原因 , 且 没 有 
给 出 解决 方法 。 

颠覆 性 指数 D 关于 Ni 不 满足 单调 性 是 指 , 当 N; 
> Ns 时 ,D 关于 Ni 单调 递减 ,而 当 Nj < Ns 时 ,D 关于 
N 单调 递增 , 当 N; = N 时 , 却 又 关于 Ni 非 单 调 , 如 表 
1 所 示 。 在 颠覆 性 指数 的 计算 公式 中 ,Nu 的 含义 是 
“在 焦点 论文 发 表 之 后 ,只 引用 焦点 论文 的 参考 文献 、 
不 引用 焦点 论文 的 施 引 文献 数量 ”。 这 类 施 引 文献 是 
对 参考 文献 的 继承 或 发 展 , 体 现 的 是 参考 文献 而 不 是 
焦点 论文 的 重要 性 ,所 以 根据 直观 判断 ,N; 越 大 ,焦点 
论文 的 颠覆 性 越 小 。 但 是 , 当 N; < Ns 时 ,由 于 D 关于 
Ns 单调 递增 ,颠覆 性 指数 会 随 N; 类 引文 的 增加 而 变 
大 , 便 出 现 了 颠覆 性 指数 D 的 不 一 致 性 。 
表 1 ， 苏 覆 性 指数 关于 Ns 的 不 一 致 性 举例 


Ne 和 Ns 焦点 论文 NE Ns Ne DD D 关 于 Ne 的 
相对 关系 单调 性 
NF>NB A 90 10 0 0.8 单调 递减 
B 90 10 100 0.4 
Np<Ns C 10 90 0 -0.8 单调 递增 
D 10 9%0 100 -0.4 
NF=NB E 10 10 0 0 非 单调 
F 10 10 100 0 
Ce 90 90 100 0 


表 1 通过 举例 体现 颠覆 性 指数 D 关于 Ns 的 不 一 
致 性 。 数 学 上 , 凑 覆 性 指数 D 关于 Ni 的 求 导 结果 如 
式 (2) 所 示 : 
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oD Ns -Ne 
ONj N + (2N, +2N;) : Ni + Ns +2NpN, +N,” 
式 (2) 
由 式 (2) 可知,D 关于 Ns 导数 的 正 负 取决 于 N， 
和 N 的 相对 大 小 关系 ,因此 ,颠覆 性 指数 D 的 单调 性 
受 N 和 Ni 的 影响 。 当 N, > N, 时 ,导数 小 于 0; 当 N， 
< Ns ,导数 大 于 0。 
3 ”颠覆 性 指数 的 改进 算法 
3.1 ”颠覆 性 指数 改进 算法 相关 因素 界定 
L，Wu 等 将 引文 结构 中 的 引文 划分 为 类 .B 类 、 
R 类 这 3 种 类 型 ,本文 的 改进 继续 借鉴 这 种 替代 性 
的 表达 思想 ,所 以 3 种 类 型 引文 是 颠覆 性 指数 改进 的 
重要 相关 因素 。 现 将 各 类 引文 的 含义 界定 如 下 :对 于 
体现 焦点 论文 的 性 质 而 言 ,F 类 引文 体现 焦点 论文 其 
汝 参考 文献 ,B 类 引文 说 明 焦点 论文 是 对 参考 文献 
展 ,R 类 引文 揭示 焦点 论文 对 参考 文献 的 继承 。 
即 光 类 .B 类 和 R 类 引文 分 别 代表 焦点 论文 的 颠覆 性 、 
屡 性 和 继承 性 。 
己 由 于 颠覆 性 指数 D 是 依据 N: 和 Ns 的 相对 大 小 
关 秋 测度 颠覆 性 ,所 以 本 文 认为 D 算法 下 的 颠覆 性 指 
效 吉 一 种 * 相 对 "的 概念 。 相 应 地 ,本 文 将 仅 由 下 类 引 
艾 傈 现 的 颠覆 性 指数 定义 为 "绝对 颠 复 性 指数 "。 
3, 转 绝对 颠覆 性 指数 D， 
从 “绝对 ”的 角度 出 发 ,结合 3 种 类 型 引文 的 含义 ， 
本 实 基于 3 点 对 颠覆 性 指数 D 进行 改进 :其 一 ,论文 的 


颠 桥 隆 仅仅 体现 于 了 类 引文 ;其 二 , 随 着 下 类 引文 数量 


的 婴 加 ,产生 类 引文 的 偶然 性 降低 , 即 由 其 本 质 主 
导 , 产 生 下 类 引文 的 必然 性 增加 ,因此 颠覆 性 的 增长 速 
率 会 因 了 类 引文 的 增加 而 变 大 ,而 非 变 化 率 不 变 ;其 
三 ,由 于 R 类 引文 与 焦点 论文 的 研究 主题 可 能 存在 较 
大 差异 ,所 以 R 类 引文 对 颠覆 性 指数 的 影响 理应 适当 
小 于 其 他 两 类 引文 。 基 于 以 上 考虑 ,得 到 颠覆 性 指数 
的 改进 算法 D;, 即 


2 


2N, , 
Ds = 3N TIN FN 2 


D; 体现 的 颠覆 性 仅 由 了 类 引文 进行 度量 ,得 到 的 


D;e [0,N;] 


D 通过 对 下 类 引文 和 B 类 引文 进行 比较 ,得 到 的 是 在 
发 展 性 相 比 之 下 ,焦点 论文 的 颠覆 性 程度 。 因 此 ,本 文 
将 D; 称 为 焦点 论文 的 绝对 颠覆 性 指数 ,将 D 称 为 相对 
颠覆 性 指数 。 知 Nr =0, 则 绝对 凑 覆 性 指数 D; 为 0 ,与 
其 他 量 无 关 ;而 其 相对 颠 履 性 D 可 能 为 负 。 那 么 ,在 


D; 算法 的 设计 思想 下 ,如 何 判 断 一 篇 论文 的 相对 颠覆 
性 倾向 ? 
3.3 判断 相对 颠覆 性 倾向 
由 于 Dz 只 度量 绝对 颠覆 性 程度 ,所 以 “中立 " 施 
引文 献 ( 即 R 类 引文 ) 的 存在 也 会 降低 颠覆 性 指数 。 
因此 ,界定 “倾向 颠覆 "的 对 立 面 是 “不 倾向 颠覆 "一 一 
包括 “倾向 发 展 " 和 “中 立 ”。 
假设 N; =0, 论 文 的 被 引 频次 记 为 C ,那么 ， 
(1) 当 Ns < = Ns 时 ,论文 不 倾向 颠覆 ,此 时 有 : 
人 
未 2N,” 和 人 本 p 
” 2N;+2N, Ni+N 2 2 
Nr +Ns 
(2) 当 Ni > Ns 时 ,论文 倾向 颠覆 ,此 时 有 : 
C 


C 
= 一 其 = 
4 ,其 中 C 


式 (4) 


pe 2N,” 2Ne 和 
2 2Ni+2N 2N; +2N, 2 
=N, +N, 式 (5) 

(3) 由 于 R 类 引文 体现 的 是 继承 性 ,这 类 引文 的 
存在 会 使 判断 相对 颠覆 的 分 界线 进一步 降低 ,所 以 当 
N 为 0 时 的 相对 颠覆 分 界线 ,是 普通 情形 下 该 分 界线 
的 最 高 值 , 当 Na 不 为 0 时 依然 适用 。 

综 上 (1) (2)(3),C/4 是 判断 焦点 论文 相对 颠覆 
性 倾向 的 界限 , 当 D, = C/4 时 ,焦点 论文 中 立 。 

3.4 ”相对 颠覆 性 指数 Rela_D， 

在 D; 设计 思想 下 ,为 度量 论文 的 相对 颠覆 性 倾向 
程度 ,本 节 以 相对 颠覆 性 分 界线 为 标准 ,将 相对 颠覆 性 
表示 为 D 关于 该 分 界线 的 相对 值 , 记 为 Rela_D,。 为 
消除 被 引 频 次 造成 的 差异 ,将 其 算法 表示 为 : 


了 
于 = 


D. 8N,” 
Rela_D,=— = , Rela_D,e 10,4] 
” DD 2C+C.N, “ 
4 


式 (6) 
在 D; 和 Rela_D; 下 , 表 1 中 几 篇 论文 的 颠覆 性 指 
数 如 表 2 所 示 : 


表 2 改进 指标 验证 


Nr 和 Ns 焦点 NE Ns Nk Dz Rela_Dz NR 
相对 关系 论文 单调 性 
F>NB A 90 10 0 81.00 3.24 单调 递减 
B 90 10 100 54.00 2.16 
F<NB 10 90 0 1.00 0.04 单调 递减 
D 10 90 100 0.67 0.03 
F=NB E 10 10 0 5.00 ”1.00 单调 递减 
F 10 10 100 1.43 0.29 


由 表 2 可 见 : 在 论文 A 与 B.C 与 DE 与 FF 之 间 ， 


86 


刘 小 慧 ， 沈 哲 思 , 摩 宇 ， 


六 VV 人 /全 甘 昌 工 
ChninaXIv 合 作 期 于 | 


等 . 科研 论文 颠覆 性 指数 的 改进 及 其 影响 因素 研究 [J]. 图 书 情 报 工 作 ,2020 ,64(24) :84 - 91. 


无 论 N; 和 Nn 的 大 小 关系 如 何 ,D; 和 Rela_D, 均 关 于 
N; 单调 递减 ,满足 了 一 致 性 。 
3.5 改进 效果 验证 
本 小 节 通 过 美国 物理 学 会 (American Physical Soci- 
ety, APS) 弃 下 期 刊 论文 和 评选 出 的 里 程 碑 式 ( Mile- 
stone ) 论文 为 例 对 改进 效果 进行 验证 。 美 国 物理 学 会 
主办 期 刊 Physical Review 系列 是 国际 物理 学 界 的 重要 
期 刊 ,其 中 Physical Review Letter( PRL) 为 物理 学 界 公 认 
的 顶级 期 刊 ,主要 刊载 对 物理 学 界 有 重大 影响 的 前 沿 
工作 。 在 2008 年 美国 物理 学 会 成 立 50 周年 时 ,由 
APS 编 委 会 洲 选 了 一 批 APS 里 程 碑 式 论文 。 本 文 共 获 
得 APS 论文 548 133 篇 .PRL 论文 115 648 篇 、Milestone 
论文 75 篇 ;以 这 3 个 数据 集 为 例 ,验证 颠覆 性 指数 的 
殴 进 效果 。 
个 数据 集 在 不 同 算法 下 的 颠覆 性 指数 排名 的 均值 
放 3 所 示 。 根 据 数据 集 的 特点 ,APS 论文 .PRL 论文 、 
MGielione 论文 的 平均 质量 逐步 变 高 ,所 以 其 颠覆 性 排序 
Fi 逐渐 提高 。 由 表 3 可 知 ,在 Rela_Dz 和 了 D; 算法 下 ,3 
个 北 据 集 均 呈 现 出 上 述 的 相对 变化 ,而 D 算法 下 ,PRL 
论 33 的 排名 呈现 下 降 的 结果 ,与 直观 判断 不 符 。 同 时 对 
lestone 论文 ,在 颠覆 性 指数 算法 D, 和 Rela_D, 算 
法 - ), 其 排序 相 比 于 D 算法 有 了 非常 大 的 提升 。 
CN 3 APs 论文 .PRL 和 Milestone 论文 在 不 同 算法 
= 下 的 颠覆 性 指数 平均 排序 ( 百 分 位 ) 


数据 集 Rela_D， D， D 
SSAPS 论文 50.0% 50.0% 50.0% 
_SPpRL 论文 39.1% 37. 8% 53.5% 
11.5% 4.1% 32.1% 


二 Milestone 论文 
[d 可 


“与 原 颠 覆 性 指数 DD 不 同 的 是 ,在 改进 过 程 中 ,提供 
了 绝对 性 角度 的 颠覆 性 指数 算法 D,, 这 种 算法 可 单独 


4 颠 履 性 指数 D, 和 Rela_D; 的 影响 因素 


引文 类 指标 通常 会 受 时 间 窗 文献 类 型 的 影响 。 
同时 ,由 于 各 个 学 科 的 知识 特点 、 研 究 性 质 、 引 用 行为 
不 同等 原因 ,引文 指标 在 不 同学 科 之 间 也 会 存在 一 定 
差异 。 本 节 就 引文 时 间 窗 .学 科 差 异 和 文献 类 型 对 颠 
履 性 指数 D, 和 Rela_D; 的 影响 进行 探讨 ,以 期 提供 合 
理 使 用 颠覆 性 指数 的 应 用 建议 。 

4.1 引文 时 间 窗 

颠覆 性 指数 依赖 于 引文 ,是 动态 指标 。 由 于 引文 
的 积累 需要 一 定 的 时 间 , 所 以 在 论文 的 被 引 量 相对 稳 
定 后 , 才 可 以 计算 出 更 加 接近 论文 真实 水 平 的 颠覆 性 
指数 。 由 于 不 同学 科 的 论文 其 被 引 量 趋 于 相对 稳定 的 
时 间 存 在 差异 ,因此 ,计算 不 同学 科 颠 覆 性 指数 时 ,也 
应 有 各 自 合理 的 时 间 窗 。 本 文选 用 动态 引文 时 间 窗 
( 即 引 文 窗 ) 来 考察 不 同学 科 中 引文 窗 对 D, 和 Rela_ 
D; 指标 的 影响 。 同 时 ,以 被 引 频 次 随 引 文 窗 的 变化 趋 
势 作为 对 比 ,进行 分 析 。 

为 此 ,本 节选 取 Web of Science 库 中 2007 年 SCI 
论文 作为 焦点 论文 ,参考 文献 最 早 追溯 到 1900 年 , 先 
后 计算 了 引文 窗 为 2 年 4 年 .6 年 8 年 和 10 年 时 的 颠 
履 性 指数 。 由 于 计算 机 科学 .工程 科学 领域 会 议论 文 
占 比 高 ,更 多 收录 于 CPCI; 经济 与 商业 、 社 会 科学 的 论 
文 更 多 收录 于 SSCI, 因 此 ,在 本 节 的 分 析 中 但 除了 以 上 
4 个 学 科 的 论文 数据 。 共 得 到 焦点 论文 795 022 篇 。 

经 计算 ,各 学 科 论 文 在 不 同 引 文 窗 下 的 绝对 颠覆 
性 指数 D, 和 相对 颠覆 性 指数 Rela_D; 分 别 如 图 2 和 
图 3 所 示 ,被 引 频 次 变化 趋势 见 图 4( 图 中 使 用 的 均 是 
各 指标 的 平均 值 ) 。 

结合 图 2 -图 4 可知 :中 在 论文 发 表 4 年 以 后 ,不 


使 用 ,适用 于 考察 焦点 论文 的 颠覆 性 特性 对 科学 发 展 
的 影响 程度 及 推动 作用 的 情形 ,这 种 算法 不 同 于 R. 
Funk 提 到 的 被 引 频次 的 简单 乘积 ” 。 

综 上 所 述 ,Rela_D; 是 D 关于 Ni 不 满足 单调 性 的 
改进 , 且 Rela_D; 与 D 均 属 于 颠覆 性 指数 相对 性 角度 
的 度量 算法 ,适用 于 仅 关 注 焦 点 论文 自身 颠覆 倾向 性 
(倾向 颠覆 或 倾向 发 展 ) , 而 不 关注 其 颠覆 性 影响 规模 
的 情形 。D; 是 D 改进 的 过 程 产物 ,提供 了 一 种 新 的 度 
量 颠 覆 性 的 视角 ,反映 焦点 论文 的 颠覆 性 属性 在 科学 界 
中 的 影响 规模 ,可 单独 使 用 ,其 适用 情形 与 相对 性 角度 
相反 , 且 D; 关于 Ni 单调 .关于 N; Ns 严格 单调 ,属于 归 
履 性 指数 绝对 性 角度 的 度量 算法 。 综 合 运用 Rela_D， 


on 


同学 科 的 被 引 频 次 逐渐 产生 了 较 大 差距 ,尤其 6 年 后 
更 加 明显 。 同 时 ,被 引 频 次 的 不 同人 带 来 了 两 种 颠覆 性 
指数 D, 和 Rela_D; 在 不 同 引文 窗 下 的 明显 差距 。 由 
此 可 见 ,引文 窗 会 通过 被 引 频 次 对 颠覆 性 指数 产生 影 
响 , 所 以 ,要 取得 更 加 接近 论文 真实 水 平 的 颠覆 性 指 
数 ,最 好 要 在 足够 的 时 间 窗 下 其 被 引 频 次 趋 于 相对 稳 
定之 后 。 凶 图 4 中 各 学 科 被 引 频 次 的 变化 率 小 于 两 种 
颠覆 性 指数 。 这 说 明 ,通过 时 间 的 沉 省 ,各 学 科 的 被 引 
频次 会 产生 一 定 变化 的 同时 ,3 种 类 型 (上 类 、B 类 和 有 
类 ) 施 引文 献 的 数量 同样 会 产生 差异 ,因此 ,引文 窗 会 
通过 3 种 类 型 施 引 文献 数量 差异 的 累积 ,更 直接 地 作 
日 于 颠覆 性 指数 。 


| 


和 D; ,可 以 更 全 面 、 合 理 地 揭示 焦点 论文 的 颠覆 性 水 平 。 
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引文 时 间 窗 (年) 

本 图 2 不 同学 科 Ds 随 引文 时 间 窗 的 变化 趋势 
之 0.12 材料 
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图 4 不 同学 科 被 引 频 次 随 引 文 时 间 窗 的 变化 趋势 


4.2 ” 库 覆 性 指数 的 学 科 差 异 

根据 经 验 ,引文 指标 一 般 都 会 存在 学 科 差 异 。 但 
是 根据 算法 的 构造 ,颠覆 性 指数 D; 的 分 子 和 分 母 在 量 
纲 上 存在 差别 ,而 Rela_D; 则 不 然 。 那 么 是 否 可 以 断 
定 D; 存在 学 科 差异 ,而 Rela_D; 不 存在 呢 ? 本 方 以 
2015 年 SCI 论文 为 例 , 通 过 两 种 方式 探究 两 种 颠覆 性 
指数 的 学 科 差 异 ,其 中 ,计算 颠覆 性 指数 的 引文 窗 统 一 
为 2 年 ,焦点 文献 共 1 318 359 篇 。 

累积 分 布 图 可 以 描绘 数据 集中 数据 在 各 阶段 的 增 
长 情况 ,从 而 帮助 判断 数据 的 分 布 特点 。 本 节 首 先 分 
别 绘制 了 D; 指数 和 Rela_D; 指数 下 各 个 学 科 的 累积 
分 布 图 , 以 供 观察 两 个 题 覆 性 指数 的 学 科 差异 , 见 
5。 


5 各 学 科 的 Rela_D; 指数 和 D; 指数 累积 分 布 
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刘 小 慧 ， 沈 哲 思 , 刻字, 等 . 科研 论文 颠覆 性 指数 的 改进 及 其 影响 因素 研究 [J EE dl heed ih 91. 
由 图 5 的 左 图 可 知 , 累积 函数 曲线 体现 的 学 科 差 一 般 不 含有 原创 性 的 科学 知识 。 据 经 验 判 断 ,一般 认 
异 非 常 明显 ,所 有 学 科 可 被 分 为 4 组 :第 一 组 ,包含 分 为 Article 论文 的 颠覆 性 更 高 。 那 么 ,文献 类 型 是 否 会 


子 生物 与 遗传 .空间 、 神 经 科学 、 微 生物 .生物 与 生化 、 
化 学 ;第 二 组 ,包含 精神 病 学 ,物理 .植物 与 动物 .地 学 、 
环境 生态 ,药理 和 毒 理 .免疫 ;第 三 组 ,包含 临床 医学 、 
材料 科学 ,农业 ;第 四 组 是 数学 。 而 在 图 5 的 右 图 中 ， 
整体 而 言 各 学 科 差 异 相 对 较 小 ,但 各 学 科 在 D; 最 小 值 
处 的 论文 比例 有 着 较 大 差异 ,从 75% 到 接近 85% 不 
等 ;此 外 ,在 累积 函数 曲线 上 ,各 学 科 也 有 不 同 。 
从 累积 分 布 的 角度 ,可 以 断定 各 学 科 在 两 种 颠覆 

性 指数 下 均 存 在 分 布 差异 。 不 过 ,累积 分 布 图 没有 用 
量化 的 数据 体现 差异 ,因此 ,下 面 应 用 统计 检验 进一步 
进行 分 析 。 

= 首先 ,经 K-S 检验 发 现 ,2015 年 各 学 科 的 SCI 论文 
在 侈 01 显著 性 水 平 上 均 不 服从 正 态 分 布 ,因此 ,对 于 
和 颠 移 性 指数 学 科 差 异 的 分 析 只 能 用 非 参 检验 方法 。 本 
蜀 吕 用 K-S( Kolmogorov-Smimov ) 检验 和 开 -W(Kruscall- 
Was) 检验 两 种 方法 进行 颠覆 性 指数 的 学 科 差 异 检 


ll 


(1) K-S 检验 。K-S 检验 是 一 种 常用 的 非 参 数 统 
验方 法 ,用 于 检验 两 个 样本 数据 的 分 布 是 否 一 致 。 
通过 Python 的 ks_2samp( ) 函数 进行 验证 ,显著 性 
惟 取 0 001 , 即 如 果 了 值 小 于 0. 001 , 则 认为 两 个 样 
本 兢 分 布 特征 存在 差异 。 

DS(2)K-W 检验 。K-W 检验 可 用 于 检验 多 个 样本 总 
体 六 分 布 是 否 存 在 显著 差异 。 其 本 质 是 考察 各 组 样本 
平 招 秩 的 差异 ， 知 平均 秩 存在 差异 , 则 几 组 样本 分 布 存 
在 要 蜡 。 本 方法 同样 选用 0.001 fe 
表 4 颠覆 性 指数 学 科 差异 的 非 参 检验 结 


指标 K-S 检验 K-W 检验 
Dz 99.26% 36.76% 
Rela_Dz 100. 00% 43.38% 


表 4 中 给 出 的 是 颠覆 性 指数 的 两 种 算法 在 不 同 检 
验方 法 下 ,P 值 小 于 0. 001 的 学 科 对 比例 , 即 存在 学 科 
差异 的 学 科 对 比例 。 由 表 4 可 知 , 两 种 检验 方法 均 可 
以 说 明 丰 覆 性 指数 D, 和 Rela_D; 在 0.001 显著 性 水 
平 上 存在 学 科 差 异 。 

4.3 文献 类 型 

Article 和 Review 是 科学 研究 最 为 常见 的 两 种 文 
献 类 型 。 一 般 认为 ,Article 论文 是 在 理论 或 方法 等 方 
面具 有 原创 性 的 研究 ,通常 能 产生 一 些 新 的 发 现 , 揭 示 


影响 颠覆 性 指数 ? 

本 节 以 2015 年 SCI 世界 论文 为 例 探 索 这 一 问题 。 
其 中 Article 论文 有 1 241 475 篇 ,Review 论文 有 76 884 
篇 。 表 5 给 出 了 两 种 类 型 的 论文 在 两 个 颠覆 性 指数 下 
的 均值 和 置信 区 间 ,其 中 置信 区 间 的 计算 应 用 了 Boot- 
strapping 算法 。 计 算 过 程 中 , Article 论文 随机 抽取 
5 000 次 ,每 次 50 万 个 ;Review 论文 随机 抽取 1 000 次 ， 
每 次 抽取 1 万 个 ; 均 取 95% 置信 度 。 

表 5 Review 论文 和 Article 论文 在 D, 和 
Rela_D; 算法 下 的 均值 
文献 类 型 Dz 

0.983(0.76,1.28) 


Rela_Dy 


0.054(0.047 ,0.057) 


Reviews 


0.541(0.49 ,0.60) 0.137(0. 132 ,0. 139 ) 


Articles 


由 表 5 可 知 : 四 从 绝对 颠覆 性 D, 看 ,Review 论文 
比 Article 论文 颠 履 性 指数 高 。 一 方面 ,这 是 由 于 两 种 
类 型 的 文献 其 颠覆 性 指数 不 符合 正 态 分 布 ,日 Review 
论文 样本 数量 明显 小 于 Article; 男 一 方面 , 据 前 期 研 
究 , 苏 覆 性 指数 D, 与 被 引 频 次 在 一 定 程度 上 是 正 相 关 
关系 ,而 两 类 型 的 论文 篇 均 被 引 频 次 分 别 为 : Article 
9 66 次 , Review 12. 23 次 ,具有 较 大 差异 。 虽然 D; 指 
数 高 于 Article 论文 ,但 是 华文 的 这 种 特点 主要 
是 由 被 引 频 次 高 所 致 ,而 非 在 科学 创新 性 上 高 于 Arti- 
cle 论文 ,换言之 ,研究 性 质 的 差异 决定 了 站 覆 性 指数 
在 不 同文 献 类 型 之 间 不 具有 可 比 性 。@ 从 相对 颠覆 性 
Rela_D, 看 ,Article 论文 的 颠覆 性 程度 更 高 ,这 体现 的 
是 两 种 文献 类 型 的 本 质 差 异 。 在 算法 构成 上 ,两 种 文 
献 类 型 的 本 质 导致 Article 论文 具有 相对 更 多 的 类 引 
文 ,使 得 相对 颠覆 程度 更 高 。 因 此 可 以 说 明 , 相 比 Re- 
view ,Article 的 原创 性 更 高 。@) 无 论 从 绝对 角度 还 是 相 
对 角度 ,文献 类 型 确实 是 影响 科研 论文 颠覆 性 指数 的 
因素 。 


$5 讨论 与 总 结 


颠覆 性 指数 从 施 引 文献 的 角度 ,度量 焦点 论文 蔡 
代 参 考 文献 的 程度 ,以 衡量 其 原创 性 。L，Wnu 等 的 指 
标 算法 D 表达 的 是 一 种 相对 性 概念 ,思想 巧妙 ,但 是 在 
数学 上 存在 不 一 致 性 ,从 而 可 能 导致 在 应 用 中 产生 有 
误导 性 的 结论 。 基 于 该 问题 ,本 文 在 遵从 原 思想 的 基 
础 上 ,提出 了 新 的 颠覆 性 指数 算法 Rela_Dz , 既 解 决 了 
原 算 法 的 不 一 致 性 问题 ,又 在 改进 过 程 中 提供 了 一 个 


Review 立 


人 类 认 知 范围 内 新 的 科学 问题 ;Review 论文 是 对 过 去 
一 段 时 间 内 某 主 题 领域 科学 研究 发 展 的 梳理 与 总 结 ， 


绝对 性 角度 的 算法 Dz ,可 帮助 更 加 全 面 地 衡量 科研 论 
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文 的 颠 柳 性 。 

此 外 ,每 个 指标 都 有 其 影响 因素 和 应 用 特征 ,为 帮 
助 更 全 面 认识 .更 合理 应 用 改进 的 颠覆 性 指数 ,本 文 第 
4 节 考 虑 一 般 引 文 类 指标 最 常见 的 特点 ,从 引文 窗 ,学 
科 差异 文献 类 型 3 个 角度 ,探索 绝对 上 颠 柳 性 指数 D， 
和 相对 颠覆 性 指数 Rela_D, 的 影响 因素 。 从 结论 看 ,3 
个 因素 均 会 影响 颠 黎 性 指数 ;但 从 根本 上 看 ,这 些 因素 
产生 作用 的 机 理 均 是 由 颠覆 性 指数 与 被 引 频次 之 间 的 
不 独立 关系 所 致 ,后 续 将 对 此 开展 详细 研究 。 

改进 的 颠 黎 性 指数 算法 ,具有 一 般 引 文 评价 指标 
的 局 限 性 ,比如 无 法 区 分 引用 态度 带 来 的 影响 ` 受 引文 
时 间 窗 影响 , 零 被 引 论文 无 法 评价 等 ;但 是 也 具有 一 般 
引文 指标 不 具备 的 不 易 操纵 等 优点 。 整 体 而 言 , 颠 赣 
性 指数 是 科研 评价 方法 中 的 一 种 进步 。 此 外 ,在 研究 
友 国 上 ,本 文 希望 为 计量 指标 不 一 致 性 问题 的 解决 提 
供 B3 种 思路 ;同时 ,希望 为 科研 评价 提供 一 个 更 加 科学 

再 的 定量 指标 ,以 正确 揭示 科学 活动 规律 ,帮助 相关 
部 和 更 公正 ,高 效 地 进行 科研 管理 。 
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The Research about the Improved Disruption Index and Its Influencing Factors 
Liu Xiaohui” Shen Zhesi Liao Yu” Yang Liying” 
' National Science Library, Chinese Academy of Sciences, Bejing 100190 
“ Department of Library, Information and Archives Management, School of Economics and Management, 
University of Chinese Academy of Sciences, Beijing 100190 
TE Abstract : | Purpose/ significance | To solve the inconsistency of disruption index D, and investigate the affect- 
(Cif factors of disruption index in specific applications. | Method/process| This paper pointed out the inconsistency 
blem of disruption index D, and then proposed Rela_D, and D, as alternatives to solve the inconsistency problem 
CHD. Finally, the factors affecting Rela_D, and D, were studied from the perspective of citation time window, disci- 
he difference and document types. | Result/conclusion | Rela_D, avoids the inconsistency problem by solving the 
ip-monotonic problem of D with respect to N;. D, overcomes the non-strict monotonic problem of D with respect to 
and N,. Taking into account the relative and absolute disruption index will result in more reasonable results. In 
Caqgition，Rela_D; and D;, are influenced by citation time window, disciplines and document types. Necessary pro- 
Ooing steps are needed when applying the disruption index. 


之 Keywords: disruption index creativity inconsistency ， scientific evaluation citation analysis 
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